На главную страницу второго семестра

Глобальное и локальное выравнивание аминокислотных последовательностей

Матрицы переходов

Глобальное выравнивание

     Было предложено построить глобальное выравнивание двух
коротких последовательностей:
1) Последовательность из первых 4-х остатков данного белка.
2) Последовательность из 5 букв, полученную следующим образом:
в последовательность первых 4-х остатков данного белка были
введены две замены 
и в произвольном месте была вставлена дополнительная буква. 
В результате применения к данным последовательностям алгоритма
Нидельмана-Вунша
была получена следующая матрица:
При построении были использованы следующие параметры:

  • Последовательности: SEQH, SNDQK
  • Вес совпадения — 2, вес замены — -1, штраф за делецию — -2
  • Оптимальное выравнивание:
    S-EQH
    |  |
    SNDQK
  • Вес: 0

Локальное выравнивание

     Было предложено построить локальное выравнивание двух коротких последовательностей:
1) Последовательность из первых 9-ти остатков данного белка.
2) Последовательность, составленная из ы 2, 3, 7, 8, 9 аминокислотных остатков данного белка 
В результате применения к данным последовательностям алгоритма Смита-Ваттермана
была получена следующая матрица:
При построении были использованы следующие параметры:

  • Последовательности: SEQHAQGAD, EQGAD
  • Вес совпадения — 2, вес замены — -1, штраф за делецию — -2
  • Оптимальные выравнивания:
    EQHA    GAD
    || |  и |||
    EQGA    GAD
    
  • Веса: 6 и 5 для оптимального и субоптимального путей соответственно

Влияние параметров на глобальное выравнивание

    Было предложено построить глобальные выравнивания для двух последовательностей:
данного белка и короткой последовательности составленной из двух участков последовательности
данного белка длиной не больше 12 а.о. каждый. Построение производилось с помощью программы matcher.
Ниже представлены полученные выравнивания и параметры, при которых они строились:
Параметры
SYK1_ECOLI         1 SEQHAQGADAVVDLNNELKTRREKLANLREQGIAFPNDFRRDHTSDQLHA     50
                     ||||||||||.. ||.|:...                             
thirdprot.fas      1 SEQHAQGADAEA-LNIEVAVA                                  20

SYK1_ECOLI        51 EFDGKENEELEALNIEVAVAGRMMTRRIMGKASFVTLQDVGGRIQLYVAR    100
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       101 DDLPEGVYNEQFKKWDLGDILGAKGKLFKTKTGELSIHCTELRLLTKALR    150
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       151 PLPDKFHGLQDQEARYRQRYLDLISNDESRNTFKVRSQILSGIRQFMVNR    200
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       201 GFMEVETPMMQVIPGGAAARPFITHHNALDLDMYLRIAPELYLKRLVVGG    250
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       251 FERVFEINRNFRNEGISVRHNPEFTMMELYMAYADYKDLIELTESLFRTL    300
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       301 AQDILGKTEVTYGDVTLDFGKPFEKLTMREAIKKYRPETDMADLDNFDSA    350
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       351 KAIAESIGIHVEKSWGLGRIVTEIFEEVAEAHLIQPTFITEYPAEVSPLA    400
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       401 RRNDVNPEITDRFEFFIGGREIGNGFSELNDAEDQAQRFLDQVAAKDAGD    450
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       451 DEAMFYDEDYVTALEHGLPPTAGLGIGIDRMVMLFTNSHTIRDVILFPAM    500
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       501 RPVK    504
                         
thirdprot.fas     21          20

SYK1_ECOLI         1 SEQHAQGADAVVDLNNELKTRREKLANLREQGIAFPNDFRRDHTSDQLHA     50
                                                                 |:| ||
thirdprot.fas      1                                             SEQ-HA      5

SYK1_ECOLI        51 EFDGKENEELEALNIEVAVAGRMMTRRIMGKASFVTLQDVGGRIQLYVAR    100
                     :  |   .:.||||||||||                              
thirdprot.fas      6 Q--G---ADAEALNIEVAVA                                   20

SYK1_ECOLI       101 DDLPEGVYNEQFKKWDLGDILGAKGKLFKTKTGELSIHCTELRLLTKALR    150
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       151 PLPDKFHGLQDQEARYRQRYLDLISNDESRNTFKVRSQILSGIRQFMVNR    200
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       201 GFMEVETPMMQVIPGGAAARPFITHHNALDLDMYLRIAPELYLKRLVVGG    250
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       251 FERVFEINRNFRNEGISVRHNPEFTMMELYMAYADYKDLIELTESLFRTL    300
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       301 AQDILGKTEVTYGDVTLDFGKPFEKLTMREAIKKYRPETDMADLDNFDSA    350
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       351 KAIAESIGIHVEKSWGLGRIVTEIFEEVAEAHLIQPTFITEYPAEVSPLA    400
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       401 RRNDVNPEITDRFEFFIGGREIGNGFSELNDAEDQAQRFLDQVAAKDAGD    450
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       451 DEAMFYDEDYVTALEHGLPPTAGLGIGIDRMVMLFTNSHTIRDVILFPAM    500
                                                                       
thirdprot.fas     21                                                        20

SYK1_ECOLI       501 RPVK    504
                         
thirdprot.fas     21          20
   
Штраф за открытие делеции 10 1
Штраф за продолжение делеции 1 1
   
Первое, что бросается в глаза - это резкая разница в гепах. В результате резкого увеличения штрафа, 
мы получили более "короткое" выравнивание, т.е. программа попыталась максимально 
сблизить аминокислоты мутантной последовательности, но на самом деле, в идеале, программа 
должна поставить вторую часть на то место, с которого она была снята, так же как поступила и 
с первой, однако для этого необходимо поставить ещё меньшее значение штрафа за 
открытие делеции.

© Долудин Юрий, 2005